Unified Cache Manager (UCM) adalah alat perangkat lunak yang dirancang oleh Huawei untuk meningkatkan efisiensi inferensi dalam model AI. Dengan mengalokasikan data berdasarkan kebutuhan latensi, UCM dapat mengurangi latensi inferensi secara signifikan.